Seguretat de la IA

Algunes maneres en què una IA avançada desalineada podria intentar obtenir més poder. Els comportaments de recerca de poder poden sorgir perquè el poder és útil per aconseguir pràcticament qualsevol objectiu [1] (vegeu convergència instrumental).

La seguretat de la IA és un camp interdisciplinari preocupat per prevenir accidents, mal ús o altres conseqüències perjudicials que podrien derivar-se dels sistemes d'intel·ligència artificial (IA). Comprèn l'ètica de les màquines i l'alineació de la IA, que tenen com a objectiu fer que els sistemes d'IA siguin morals i beneficiosos, i la seguretat de la IA inclou problemes tècnics, inclosos els sistemes de monitorització de riscos i fer-los altament fiables. Més enllà de la investigació en IA, implica desenvolupar normes i polítiques que promoguin la seguretat.


© MMXXIII Rich X Search. We shall prevail. All rights reserved. Rich X Search